Federated Learning Performance Depends on Site Variation in Global HIV Data Consortia
该研究利用来自加勒比、中美洲及南美洲六地的 22,234 名 HIV 感染者数据,证实联邦学习能够在保护隐私的前提下,通过跨机构协作显著提升临床预测模型性能,使其接近集中式训练水平并优于单一站点模型。
193 篇论文
该研究利用来自加勒比、中美洲及南美洲六地的 22,234 名 HIV 感染者数据,证实联邦学习能够在保护隐私的前提下,通过跨机构协作显著提升临床预测模型性能,使其接近集中式训练水平并优于单一站点模型。
该研究通过对 249 名心力衰竭患者进行为期 180 天的可穿戴设备监测,发现步数减少、症状加重及就诊前三天静息心率升高是预测住院风险的关键指标,证实了利用可穿戴数据早期识别病情恶化并及时干预的潜力。
该研究开发并验证了一种基于多标签 BERT 的自然语言处理应用,能够从南伦敦大型精神健康服务的电子病历自由文本中高效提取并分类多种暴力形式(如情感、财务、非性身体暴力)及其相关特征(如施受者角色、发生情境等),从而显著提升了从常规精神健康记录中识别暴力事件的能力。
该研究证实,虚拟池(Virtual Pooling)平台能够在不集中共享数据的前提下,通过单一界面自动完成从数据清洗到因果推断的全流程分析,并精确复现多中心回顾性研究的统计结果,从而有效克服了传统多中心研究中的监管与操作障碍。
这项研究利用基于 ECGFounder 基础模型的人工智能技术,通过分析心电图预测心脏生物学年龄与实际年龄的差值(AI-ECG 年龄差),证实该指标可作为有效的非侵入性数字生物标志物,用于量化隐匿性心脏加速衰老并显著分层心血管风险。
该论文因分析存在问题需修订,作者已主动撤回稿件并请求不再将其作为参考文献引用。
本文提出了一种受监管指导启发的统计框架,通过语义和内部两个维度量化大语言模型在生物医学任务中的重复性和可复现性,并发现提示策略显著影响其输出稳定性,且稳定性与诊断准确性并无必然关联。
该研究通过对 442 名佩戴 Ultrahuman Ring 的用户进行为期 12 个月的分析,证实了可穿戴设备衍生的心血管年龄不仅与睡眠质量和步数等独立生活方式指标显著相关,且能灵敏反映生理状态的改善,表明其可作为有效的健康风险沟通工具。
这项研究在肯尼亚两家医疗机构对名为 AIFYA 的人类监督型大语言模型临床决策支持系统进行了早期评估,结果显示该系统能有效整合国家新生儿护理指南,在专家审核中展现出高准确性与引用可信度,并成功实现了在低资源环境下的落地应用。
该研究利用 1,000 份合成临床头痛病历对大语言模型进行压力测试,发现尽管模型在完整病史下诊断准确率极高,但在信息不全时仍会频繁给出危险建议(如拒绝必要检查或错误降级急症),且存在显著的性别安全差异,揭示了当前医疗 AI 评估方法的局限性。
该研究通过制定并执行缓解计划,证实了有效的治理、多学科方法及周密行动能显著降低电子健康记录(EHR)实施过程中的负面影响并提升项目成功率。
本文提出了 SleepJEPA,一种基于联合嵌入预测架构的睡眠基础模型,利用大规模家庭睡眠监测数据学习潜在睡眠表征,能够准确预测多种心血管、代谢及神经系统疾病的长期发病风险,并有效评估睡眠分期与特定睡眠障碍。
该研究通过引入两度引用分析方法,评估了四个主要开放健康数据仓库的学术影响力、研究社区构成及知识扩散情况,发现尽管各库资金规模差异巨大,其间接引用放大效应均稳定在约 10 倍,但不同数据源在低中收入国家参与度、性别代表性及高级作者地位方面存在显著差异,揭示了单纯的数据开放政策无法完全解决科研领域深层的结构性不平等。
该研究通过对尼日利亚六项医疗 AI 系统的独立混合方法纵向审计发现,厂商报告的性能指标(平均 91.5%)显著高于真实世界表现(平均 67.3%),导致大量可预防的医疗损害并加剧了弱势群体间的健康不平等,因此呼吁在资源受限地区建立强制性的独立部署后验证机制。
该研究提出了一种名为 NiaAge 的新型生物年龄框架,它通过直接利用生物标志物与长期死亡风险的非线性关联并结合健康衰老的规范轨迹进行构建,在预测死亡率和身心健康方面表现优于传统年龄及多种现有生物年龄时钟,从而成为预防医学中有价值的临床工具。
这项基于“全人类”研究计划近 26 万参与者数据的研究表明,将社会决定因素与人口统计学特征相结合能显著提升慢性病风险预测的准确性,且不同疾病类型(心理健康与心脏代谢疾病)受社会因素影响的路径存在显著差异,从而支持采用针对特定病情的社会因素筛查与干预策略以消除健康差距。
该研究通过跨国验证表明,基于电子病历时间戳的“强化文档指数”(IDI)能有效预测 ICU 死亡率,且其预测性能高度依赖于文档记录的时间粒度,在记录延迟较短的瑞士 HiRID 数据集中表现显著优于美国 MIMIC-IV 数据集及传统评分系统。
该研究利用韩国国家健康保险数据,通过受控中断时间序列分析证实,基于社交媒体患者讨论构建的“肠健康”数字自我管理平台显著降低了肠易激综合征相关的急诊就诊率和未计划住院率,尤其在年轻成人和腹泻型患者中效果更为明显。
该研究基于 14 篇 Cochrane 综述发现,在 Ovid MEDLINE 数据库上,兼顾敏感性与精确性的 RCT 过滤策略(SaPM)相比仅追求敏感性的策略(SM)能显著降低筛选负担(平均减少 83% 的筛查量),且漏检的合格记录极少,可通过引文检索加以弥补。
该研究通过对比基于大语言模型的 Brim Analytics 系统与基于本体的 DeepPhe 系统在胰腺癌和乳腺癌病理报告中的表现,证实了前者在多种注册变量提取上具有更高且更稳定的准确率,能够有效支持癌症登记数据的自动化处理流程。